- 昇腾 + DeepSeek,重塑算力与模型新格局
如今,大模型的发展呈现出“技术摸高 + 工程创新”并行的趋势。头部企业在预训练基础模型创新上坚定投入,追逐Scaling Law,加速探索通用人工智能(AGI)。他们对高效、稳定、开放的底座,极致性能、稳定可靠的AI集群,以及深度开放的平台和生态的关注度日益提升。
陶然 · 2025-02-20 09:47 - 博通和台积电要将英特尔一分为二?
多年来,人们一直急切期待英特尔能有所改观。各种离奇的交易传闻不断涌现,如今又有传言称,英特尔的竞争对手——芯片设计与销售商博通,以及芯片制造商台积电,有意将英特尔一分为二,各自拿下合适的那一半。
陶然 · 2025-02-19 15:19 - 诚迈科技成功举办北京信创兴动力研讨会,打造新质生产力创新引擎
18日,诚迈科技在北京隆重举办了“2025北京信创兴动力——新质生产力高质量发展研讨会”。两院院士、专家学者、领军企业代表聚焦信创产业、数字经济等前沿领域,深入剖析发展趋势,展示创新成果。会上,诚迈科技宣布在北京大兴区投资建设的信创电脑生产基地正式投产,填补了大兴区在信创电脑领域的空白。
陶然 · 2025-02-19 09:20 - 货拉拉 API 异常流量检测实践
API(应用程序编程接口)在企业信息流通以及应用程序和系统之间的连接中扮演着重要的角色,随着企业业务的不断拓展,越来越多的攻击者通过攻击 API 来达到破坏信息系统和窃取数据的目的,API 逐渐成为一个巨大的风险敞口来源之一。本文将从流量分析角度切入,简要阐述 API 异常流量检测的实践过程。
陶然 · 2025-02-18 17:30 - 数据中心空气冷却系统的能效指标ECR
数据中心空气冷却系统能效指标ECR的提出,该指标完善了机房环境-制冷系统-数据中心的能效评价体系,对数据中心的可持续发展具有重要的指导意义,具备广泛的推广和应用潜力。
陶然 · 2025-02-17 16:19 - HPE推出Gen12 ProLiant服务器,发力AI和边缘
本周,HPE推出了8款由至强6处理器驱动的Gen12系统,其中6款本季度即可上市,另外两款计划于今年夏天发布。这些服务器形态各异、大小不一,包括1U至4U的机架式ProLiant服务器,还有双处理器的塔式ProLiant(ML350)和刀片系统(Synergy 480)。
陶然 · 2025-02-14 16:08 - 货拉拉资损防控智能化平台建设实践
资损防控是业务稳定性保障的重要一环,资损防控治理主要分为增量场景和存量场景。在存量场景中,业务研发从现有业务场景入手,进行各业务模块的资损场景的梳理,将可能出现资损的场景梳理出来。
陶然 · 2025-02-14 15:45 - 爱奇艺的接口治理与自动化测试一体化解决方案实践
随着云原生和微服务架构的普及,公司许多服务也转向了微服务模式,以满足业务的高速发展和高流量调用需求。然而,微服务的拆分导致API数量的爆发式增长,使得接口管理和接口质量保障的问题更加凸显,具体体现在以下几个方面:
陶然 · 2025-02-14 09:57 - 快手Java透明协程:实现零代码修改提升30%QPS
对于开发者而言,传统线程模型逻辑直观但性能受限,而异步模型虽性能高却复杂性大。协程以“同步编程,异步执行”平衡两者,成为现代语言标配。结合自身业务需求,快手基于社区开源版本自研了Java17透明协程技术,实现对业务无侵入的同时,吞吐能力提升30%以上。本文将深入剖析快手协程技术的背后原理与架构演进。
陶然 · 2025-02-13 10:09 - 以抖音集团信息流推荐场景为例|如何做复杂的AB实验设计?
本文将以短视频平台的信息流推荐场景为例,结合相关团队在推荐场景开展A/B测试的实践经验,详解其复杂原理,并重点聚焦双边效应、网络效应问题,分享其对应的双边实验、社区分流实验设计思路。
陶然 · 2025-02-13 09:34 - 英特尔数据中心和AI部门主管跳槽担任诺基亚CEO
英特尔数据中心与AI部门负责人Justin Hotard将离职出任诺基亚CEO,给英特尔带来新的挑战。这一变动发生在英特尔面临多重困境之际,包括产品延迟、市场份额流失和人才流失等。公司急需稳定领导层,重振旗鼓,以应对AI和数据中心市场的激烈竞争。
陶然 · 2025-02-12 10:52 - DeepSeek-V3/R1上线背后的超低推理成本技术揭秘
近日,百度智能云千帆大模型平台正式上线了DeepSeek-R1与DeepSeek-V3模型,模型上线首日,已有超1.5万家客户通过千帆平台进行模型调用。百度智能云针对此次模型上线提供了行业领先的超低推理价格,低至DeepSeek官方刊例价3-5折,当前还可享受限时免费服务。
陶然 · 2025-02-12 09:21 - DeepSeek-V3 高效训练关键技术分析
本文从模型架构、并行策略、通信优化和显存优化四个方面展开,深入分析了DeepSeek-V3高效训练的关键技术,探讨其如何以仅5%的算力实现对标GPT-4o的性能。
陶然 · 2025-02-11 14:05 - S型智能增长曲线:从Deepseek R1看Scaling Law的未来
本文后面打算用S型智能增长曲线来解释我们目前看到的Scaling Law的一些现象。其实智能发展应该遵循S型曲线,这不是新观点,LLM最大的反对派Lecun和第二大反对派马库斯,去年在Twitter上就反复提过这个观点,以此作为否定LLM未来发展的重要依据。
陶然 · 2025-02-11 09:57 - 网易实践:用Apache Kyuubi构建云原生Spark网关
本文基于网易数帆软件工程师、Apache Kyuubi/Zeppelin PMC 成员潘成老师的分享整理汇总。通过本文,可以从网易在 Spark 服务化的经验中,学习如何使用 Apache Kyuubi 构建统一的 Spark 网关,既满足业务团队多样的 Spark 使用方式,又可以适配不同基础设施环境中多样的 Spark 部署方式。
陶然 · 2025-02-10 14:06 - 大白话说清楚DeepSeek的蒸馏技术到底是什么?
DeepSeek R1火了之后,模型蒸馏这个词儿也跟着火了。一方面,OpenAI暗戳戳的(其实已经算明指了)表示DeepSeek就是用GPT的数据来做的蒸馏(别人说你起诉啊,OpenAI又说不);另一方面,的确真有很多知名的公司利用R1版模型蒸馏出更多小模型,有基于Llama的,也有基于Qwen的,效果都不错。
陶然 · 2025-02-10 10:12 - 数据中心计算引擎的前路:CPU篇
新年伊始,数据中心计算引擎一直是我们重点关注的领域。为此,我们花时间整理了一套涵盖2023年至2027年的CPU、GPU和AI加速器的综合路线图。今天,我们将聚焦于目前市场上现有的以及即将推出的主流CPU,GPU和定制AI加速器则会另行讨论。
陶然 · 2025-02-07 17:55 - 专有云ABC Stack面向企业级智算平台的GPU提效实践
从「建好」到「用好」,企业级智算平台借助专有云 ABC Stack 的 GPU 提效服务,应对大模型业务挑战,唤醒 AI 算力,加速 AI 原生业务的落地。
陶然 · 2025-02-07 15:16